计算机愿景中的经典问题是推断从几个可用于以交互式速率渲染新颖视图的图像的3D场景表示。以前的工作侧重于重建预定定义的3D表示,例如,纹理网格或隐式表示,例如隐式表示。辐射字段,并且通常需要输入图像,具有精确的相机姿势和每个新颖场景的长处理时间。在这项工作中,我们提出了场景表示变换器(SRT),一种方法,该方法处理新的区域的构成或未铺设的RGB图像,Infers Infers“设置 - 潜在场景表示”,并合成新颖的视图,全部在一个前馈中经过。为了计算场景表示,我们提出了视觉变压器的概括到图像组,实现全局信息集成,从而实现3D推理。一个有效的解码器变压器通过参加场景表示来参加光场以呈现新颖的视图。通过最大限度地减少新型视图重建错误,学习是通过最终到底的。我们表明,此方法在PSNR和Synthetic DataSets上的速度方面优于最近的基线,包括为纸张创建的新数据集。此外,我们展示了使用街景图像支持现实世界户外环境的交互式可视化和语义分割。
translated by 谷歌翻译
一致性检查是一种过程挖掘技术,允许验证过程实例与给定模型的符合性。因此,该技术被预定在医学环境中用于将治疗案例与临床准则进行比较。但是,医学过程是高度可变,高度动态和复杂的。这使得难以在医疗领域中使用命令性一致性检查方法。研究表明,声明性方法可以更好地解决这些特征。但是,这些方法尚未获得实际接受。另一个挑战是对齐,通常不会从医学角度增加任何价值。因此,我们在案例研究中调查了HL7标准Arden语法对于宣言性,基于规则的符合度检查和使用手动建模的对齐方式的可用性。使用该方法,可以检查治疗案例的一致性,并为医疗指南的大部分地区创建有意义的对齐方式。
translated by 谷歌翻译
从几个培训示例中不断学习新课程,而不忘记以前的旧课程需要一个灵活的体系结构,而不可避免地会增加部分存储,其中可以逐步存储并有效地检索新的示例和类。一个可行的架构解决方案是将固定的深神经网络紧密融合到动态发展的明确记忆(EM)。作为该体系结构的核心,我们提出了一个EM单元,该单元在持续学习操作过程中利用节能中的内存计算(IMC)核心。我们首次证明了EM单元如何使用基于IMC Core上的操作(PCM)上的IMC核心操作,在推理期间进行了多个训练示例,扩展以适应看不见的类并进行相似性搜索。具体而言,通过PCM设备的原位进行性结晶实现了一些编码训练示例的物理叠加。与不断学习的最新完整精确基线软件模型相比,IMC核心上达到的分类精度在1.28% - 2.5%范围内保持在2.5%之内。在60个旧课程的顶部,新颖的课程(每班只有五个示例)。
translated by 谷歌翻译
通过填写数据集中的缺失值,插入允许这些数据集与无法自行处理缺失值的算法一起使用。但是,缺少的价值原则上可能会贡献通过插补而丢失的有用信息。缺失的指示方法可以与归档的结合使用,而是将此信息表示为数据集的一部分。有几个理论上的考虑因素为什么缺失指导者可能会或可能没有好处,但是在现实生活中没有任何大规模实践实验来测试此问题以进行机器学习预测。我们根据二十个现实生活数据集对三种归纳策略和一系列不同的分类算法进行此实验。我们发现,在这些数据集上,缺失指标通常会提高分类性能。此外,我们没有发现大多数算法的证据表明,最近的邻居和迭代插补比简单的平均/模式插补带来更好的性能。因此,我们建议使用具有平均/模式归档的缺失指标作为安全的默认值,需要将决策树用于防止过度拟合。在后续实验中,我们确定每个分类器的属性特异性缺失阈值,在该实验中,缺失指标更有可能增加分类性能,并观察到这些阈值的分类要比数值属性要低得多。最后,我们认为,数值属性的插补的平均值可能会保留一些信息中的某些信息,并且我们表明,在没有缺失的指示器的情况下,将平均插入量应用于单热编码的分类属性而不是,而不是有用模式插补。
translated by 谷歌翻译
提出了一个深度学习模型,以便在未来60分钟的五分钟时间分辨率下以闪电的形式出现。该模型基于反复横向的结构,该结构使其能够识别并预测对流的时空发展,包括雷暴细胞的运动,生长和衰变。预测是在固定网格上执行的,而无需使用风暴对象检测和跟踪。从瑞士和周围的区域收集的输入数据包括地面雷达数据,可见/红外卫星数据以及衍生的云产品,闪电检测,数值天气预测和数字高程模型数据。我们分析了不同的替代损失功能,班级加权策略和模型特征,为将来的研究提供了指南,以最佳地选择损失功能,并正确校准其模型的概率预测。基于这些分析,我们在这项研究中使用焦点损失,但得出结论,它仅在交叉熵方面提供了较小的好处,如果模型的重新校准不实用,这是一个可行的选择。该模型在60分钟的现有周期内实现了0.45的像素临界成功指数(CSI)为0.45,以预测8 km的闪电发生,范围从5分钟的CSI到5分钟的提前时间到CSI到CSI的0.32在A处。收货时间60分钟。
translated by 谷歌翻译
对颅面畸形的评估需要稀疏可用的患者数据。统计形状模型提供了现实和合成数据,从而实现了公共数据集上现有方法的比较。我们建立了第一个公开可获得的颅骨肌肤肤化患者的统计3D头号,并将重点关注比1.5年更年轻的婴儿。对于通信建立,我们测试和评估四种模板变形方法。我们进一步提出了一种基于模型的基于模型的基于模型的分类方法,用于摄影测图表面扫描。据我们所知,我们的研究使用最大的Craniosynosisosis患者数据集,以迄今为止的粗糙化和统计形状建模的分类研究。我们展示了我们的形状模型与人头的其他统计形状模型类似。特异性抗皱性病理学在该模型的第一个特征模具中表示。关于Craniosynostis的自动分类,我们的分类方法能够提供97.3%的精度,与使用两种计算机断层扫描扫描和立体测量法进行的其他最先进的方法相当。我们公开的颅骨弯曲特异性统计形状模型能够评估粗糙化和合成数据的颅骨。我们进一步提出了一种基于最先进的形状模型的分类方法,用于无放射诊断性的颅骨。
translated by 谷歌翻译
我们介绍了一个用于无监督异常检测和本地化任务的第一个全面的3D数据集。它受到真实的视觉检查场景的启发,其中模型必须在制造产品上检测各种类型的缺陷,即使它仅在无异常数据上培训。存在缺陷,其在物体的几何结构中表现为异常。这些导致数据的3D表示中的显着偏差。我们使用高分辨率的工业3D传感器来获取10种不同的物品类别的深度扫描。对于所有对象类别,我们展示了培训和验证集,每个培训和验证集由无异常样品的扫描组成。相应的测试集包含显示诸如划痕,凹痕,孔,污染物或变形的各种缺陷的样本。为每个异常测试样品提供精确的地面说明。我们数据集上的3D异常检测方法的初始基准指示相当大的改进室。
translated by 谷歌翻译
人类的活动识别在医学和监视领域具有重要意义。基于捕获的微多普勒({\ mu} -d)签名,雷达对该字段表示了很大的可行性。在本文中,MIMO雷达用于制定用于非切向方案中的角速度({\ mu} - {\ omega})的新型微动谱图。组合{\ mu} -d和{\ mu} - {\ omega}签名表现出更好的性能。基于公制学习方法实现了88.9%的分类准确性。实验设置旨在捕获不同方面角度和视线(LOS)上的微观运动签名。与最先进的技术相比,利用的训练数据集具有较小的尺寸,其中捕获了八项活动。几次拍摄的学习方法用于调整预训练模型进行崩溃检测。最终模型显示了十项活动的分类准确性为86.42%。
translated by 谷歌翻译
基于深度学习的人类识别的雷达已成为越来越兴趣的研究领域。已经表明,Micro Doppler($ \ MU $ -D)可以通过捕获周期性的肢体微光来反映步行行为。主要方面之一是在考虑实时和培训数据集大小约束时最大化随附的类的数量。在本文中,使用多输入 - 多数输出(MIMO)雷达来制定高程角速度的微动光谱图($ \ mu $ - $ \ $ \ omega $)。研究了将这种新型频谱图与常用$ \ mu $ -d连接的有效性。为了适应无约束的实际步行运动,使用自适应周期分割框架,并在半步态周期($ \ $ \ $ 0.5 s)上训练了公制学习网络。研究了各种类级别(5--20),不同数据集大小和不同观察时间Windows 1--2 s的影响的研究。相对于雷达,收集了22名受试者的无约束步行数据集。拟议的几次学习(FSL)方法的分类误差为11.3%,每个受试者只有2分钟的培训数据。
translated by 谷歌翻译
我们为五个数据描述符优化的一级分类提供了彻底处理一级分类:支持向量机(SVM),最近的邻居距离(NND),局部最近的邻居距离(LNND),本地离群因子(LOF)和平均局部接近性(ALP)。 SVM和LOF的超参数必须通过交叉验证进行优化,而NND,LNND和ALP允许有效的保留验证形式,并重新使用单个最近的近近地查询。我们通过从50个数据集中提取的246个分类问题来评估超参数优化的效果。从一系列优化算法中,最近的Malherbe-Powell提案最有效地优化了所有数据描述符的超参数。我们计算了测试AUROC的增加以及过度拟合的量,这是高参数评估数量的函数。经过50次评估,ALP和SVM显着胜过LOF,NND和LNND,LOF和NND的表现均优于LNND。 ALP和SVM的性能是可比的,但是ALP可以更有效地优化ALP,因此构成了一个不错的默认选择。另外,使用验证AUROC作为ALP或SVM之间的选择标准可获得最佳的总体结果,而NND是计算要求最少的选项。因此,我们最终以三种选择之间的明确权衡取舍,从而允许从业者做出明智的决定。
translated by 谷歌翻译